Transformar observações brutas em estruturas objetos R é a sequência técnica necessária para análise probabilística. Antes de modelar distribuições, devemos dominar ingestão de dados e as sutilezas estruturais entre listas, matrizes e data frames.
1. Ingestão Estruturada
Importar dados por meio de scan() muitas vezes exige uma estrutura de lista fictícia para definir os tipos de variáveis (por exemplo, list(id="", x=0)). Isso garante que dados externos de arquivos como input.dat sejam analisados em componentes gerenciáveis, em vez de vetores planos.
2. Organização Dimensional
Enquanto um matriz é usado para conjuntos numéricos homogêneos (utilizando byrow=TRUE), o data.frame() serve como a ponte definitiva para modelagem estatística, permitindo que tipos de dados heterogêneos coexistam.
3. Acesso a Variáveis
Acessar dados para inferência envolve indexação por meio de inp[[1]] ou colunas nomeadas como inp$id. Funções como attach() permitem que variáveis no objeto inteiro (como eruptions) sejam acessadas diretamente sem indexação repetida.